基准测试表明英特尔Gaudi2加速器较英伟达A100更具特定优势 只需18分钟就通过测试

来源:cnBeta | 2022-07-06 09:00:45 |

在 2019 年以 20 亿美元收购了以色列 Habana Labs 后,英特尔推出了 Gaudi2 数据中心加速卡,并将之与面世已有两年的英伟达 A100 进行了对比。事实上,Habana 制造了两种专用加速器 —— 除了面向神经网络训练的 Gaudi2,还有主打推理任务的 Goya / Greco 。

虽然早在 5 月就发布,但 MLPerf 公共数据库直到上周才接收到它的基准测试成绩。

由其分享的图表可知,Gaudi2 系统的分数,被拿来和英伟达 /戴尔的 A100 系统进行了横向比较。

首先,ResNet-50 能够测试硬件在 AI 图像分类工作上的表现。可知 Habana 的 Gaudi2 系统只需 18 分钟就通过测试,而英伟达 A100 系统需要将半个小时。

其次,Gaudi2 只用了 17 分钟来训练 BERT 模型,较 A100 系统快了大约一分钟。作为一个自然语言处理(NLP)模型,这项测试使用了来自维基百科的文章来训练。

虽然所有测试台都使用了八卡加速器 / GPU,但 Habana 系统搭配了双路 40 核的 Intel Xeon 8380 CPU,而英伟达系统则采用了双路 64 核的AMDEPYC 7742 CPU 。

规格方面,Gaudi2 具有 24 个张量处理(TPC)内核 + 并行运行的两部分矩阵乘法(MME)引擎。其支持包括 FP32、TF32、BF16、FP16 和 FP8 在内的广泛数据类型。

此外 Gaudi2 有一个专用于处理音视频输入的媒体引擎,集成 48MB 内部缓存 + 板载 96GB(6×16GB)HBM2e 高带宽内存,总带宽达到了 2.45 TB/s 。

连接方面,该加速器使用了 PCIe 4.0 x16 接口、辅以 24 个 100 Mbps RoCE2(RDMA over Converged Ethernet 2)端口。

需要指出的是,英伟达 A100 / H100 的功能要更加全面一些,Gaudi2 在某些特定任务上更具优势。

不过就算英伟达早在三个月前就发布了 H100 新品,Gaudi2 还是有望成为 A100 的一个有力竞争对手。

关键词: 英特尔公司 数据中心加速卡 神经网络训练 推理任务